智能论文笔记

视频异常分析是在计算机视觉领域积极执行的一项核心任务，其应用程序扩展到了监视录像中现实世界中的犯罪检测。在这项工作中，我们解决了与人有关的犯罪分类的任务。在我们提出的方法中，用作骨骼关节轨迹的视频框架中的人体被用作探索的主要来源。首先，我们介绍了扩展HR-Crime数据集的地面真相标签的意义，因此提出了一种监督和无监督的方法，以生成轨迹级别的地面真相标签。接下来，鉴于轨迹级的地面真相的可用性，我们引入了基于轨迹的犯罪分类框架。消融研究是通过各种体系结构和特征融合策略来代表人类轨迹进行的。进行的实验证明了任务的可行性，并为该领域的进一步研究铺平了道路。

translated by 谷歌翻译

室内场景识别是一种不断增长的领域，具有巨大的行为理解，机器人本地化和老年人监测等。在这项研究中，我们使用从社交媒体收集的多模态学习和视频数据来从新的角度来看场景识别的任务。社交媒体视频的可访问性和各种可以为现代场景识别技术和应用提供现实数据。我们提出了一种基于转录语音的融合到文本和视觉功能的模型，用于在名为Instaindoor的室内场景的社交媒体视频的新型数据集上进行分类。我们的模型可实现高达70％的精度和0.7 F1分数。此外，我们通过在室内场景的YouTube-8M子集上基准测试，我们突出了我们的方法的潜力，在那里它达到了74％的精度和0.74f1分数。我们希望这项工作的贡献铺平了在挑战领域的室内场景认可领域的新型研究。

translated by 谷歌翻译

Dynamics of Fourier Modes in Torus Generative Adversarial Networks

Ángel González-Prieto , Alberto Mozo , Edgar Talavera , Sandra Gómez-Canaval

分类：机器学习 | (统计)机器学习

2022-09-05

生成对抗网络（GAN）是强大的机器学习模型，能够生成具有高分辨率的所需现象的完全合成样本。尽管他们成功了，但GAN的训练过程非常不稳定，通常有必要对网络实施几种附属启发式方法，以达到模型的可接受收敛。在本文中，我们介绍了一种新颖的方法来分析生成对抗网络培训的收敛性和稳定性。为此，我们建议分解对手Min-Max游戏的目标功能，将定期gan定义为傅立叶系列。通过研究连续交替梯度下降算法的截短傅里叶序列的动力学，我们能够近似实际流量并确定GAN收敛的主要特征。通过研究$ 2 $ - 参数gan的旨在产生未知指数分布的训练流，从经验上证实了这种方法。作为副产品，我们表明gan中的融合轨道是周期性轨道的小扰动，因此纳什均值是螺旋吸引子。从理论上讲，这证明了在甘斯中观察到的缓慢和不稳定的训练。

translated by 谷歌翻译

随着深度学习生成模型的最新进展，它在时间序列领域的出色表现并没有花费很长时间。用于与时间序列合作的深度神经网络在很大程度上取决于培训中使用的数据集的广度和一致性。这些类型的特征通常在现实世界中不丰富，在现实世界中，它们通常受到限制，并且通常具有必须保证的隐私限制。因此，一种有效的方法是通过添加噪声或排列并生成新的合成数据来使用\ gls {da}技术增加数据数。它正在系统地审查该领域的当前最新技术，以概述所有可用的算法，并提出对最相关研究的分类法。将评估不同变体的效率；作为过程的重要组成部分，将分析评估性能的不同指标以及有关每个模型的主要问题。这项研究的最终目的是摘要摘要，这些领域的进化和性能会产生更好的结果，以指导该领域的未来研究人员。

translated by 谷歌翻译